Datenanalyse

Der Niederschlag reicht von 0 bis etwa 35 mm/m², an wenigen Tagen liegt der Niederschlag allerdings auch bei höheren Werten von bis zu 58 mm/m². Anders als bei den bisherigen Merkmalen nimmt der Niederschlag allerdings auch häufig Werte von 0 (oder fast 0) an, da es an vielen Tagen nicht regnet. Es ist zunächst etwas schwerer erkennbar, allerdings folgt der Niederschlag wie schon bei der Analyse der Wetterbeschreibung einer jährlichen Saisonalität, im Rahmen derer er sein Maximum Mitte des Jahres im Sommer erreicht und sich in den kalten Wintermonaten seinem Minimum annähert. Diese Saisonalität ist allerdings eher schwächer ausgeprägt und wird allgemein durch die vielen Tage ohne Niederschlag gestört.

Die jährliche Saisonalität zeigt sich auch bei den Boxplots. Hier ist noch einmal erkennbar, dass die Saisonalität eher gering ausgeprägt ist. Teilweise ist der Anstieg des Niederschlags in den warmen Sommermonaten nicht nur darauf zurückzuführen, dass der Niederschlag an Regentagen größer ist, sondern auch auf die Tatsache, dass es in diesem Zeitraum öfter zu Regen kommt als im Winter. Dadurch sind bei der Berechnung des Durchschnitts weniger Tage mit 0 eingerechnet.

Das Histogramm zeigt eine deutliche rechtsschiefe Verteilung in den Daten. An den meisten Tagen kommt es zu keinem Niederschlag. An Tagen mit Niederschlag liegen die Werte meisten bei unter 10 mm/m². Werte über 21 mm/m² sind äußerst selten.

Korrelationsanalyse

Liniendiagramm (Verlauf)

Beim Verlauf des Niederschlags und des Stromverbrauchs lässt sich nur bedingt ein Zusammenhang erkennen. Zwar steigen Stromverbrauch und Niederschlag in den besonders warmen Sommermonaten vermeintlich gemeinsam an, im übrigen Jahr lässt sich allerdings kein Zusammenhang erkennen. Betrachtet man die gleitenden Durchschnitte ist erkennbar, dass der Anstieg von Stromverbrauch und Niederschlag an vielen Stellen sehr asynchron ist (beispielsweise in den Jahr 2016 und 2018). Einen synchronen Anstieg gibt es nur im Jahr 2021, dieser scheint jedoch eher zufällig zu sein. Insgesamt lässt sich kein Zusammenhang zwischen den Verläufen der beiden Merkmale erkennen.

Stromverbrauch nach Niederschlag (Scatterplot)

Im Scatterplot lässt sich kein Zusammenhang von Niederschlag und Stromverbrauch erkennen. Auch die Regressionsfunktion kann keinen Zusammenhang ermitteln und ist daher fast waagerecht.

Stromverbrauch nach Niederschlag (Boxplot)

Die Boxplots lassen ebenfalls keinen Zusammenhang erkennen.

Stromverbrauch nach Niederschlag und Temperatur (Scatterplot)

Im Scatterplot wird der Stromverbrauch nach Niederschlag und Temperatur abgetragen. Hier zeigt sich zwar die deutliche Abhängigkeit des Stromverbrauchs von der Temperatur, allerdings scheint die Luftfeuchtigkeit keinen Einfluss auf den Verbrauch zu haben.

Stromverbrauch nach Regen (Boxplot)

Bisher wurde der Niederschlag in mm/m² untersucht. Wird das Merkmal allerdings zusammengefasst in einem Indikator für Tage mit oder ohne Regen, dann lässt sich ebenfalls kein Unterschied erkennen. Für den Stromverbrauch ist der Niederschlag offensichtlich irrelevant.

Regressionsanalyse

Durch die Regressionsanalyse wird geprüft, inwieweit sich der Verlauf des Stromverbrauchs anhand der verfügbaren exogenen Merkmale modellieren lässt. Es geht dabei noch nicht um die Erstellung eines Vorhersagemodells. Stattdessen wird die Regressionsanalyse eher mit Blick auf potenzielle Zusammenhänge, Korrelationen und Muster beziehungsweise generelle Verläufe durchgeführt. Aus diesem Grund bietet sich eine Funktion sechsten Grades an. Dafür wird mit den Daten von 2015 bis 2018 und den entsprechenden Merkmalen eine Regression sechsten Grades durchgeführt, welche dann mit den Daten für 2019 getestet wird. Wie bereits erwähnt, gibt es 2020 und 2021 Abweichungen vom ansonsten üblichen Verlauf. Daher werden nur die Daten bis einschließlich 2019 verwendet.

Regression mit Niederschlag

Das Regressionsmodell kann den Verlauf des Stromverbrauchs offensichtlich nicht anhand des Niederschlags abbilden. Es lässt sich nicht einmal die jährliche Saisonalität erfassen.

Regression mit Arbeitstag und Niederschlag

Wird das Modell zusätzlich mit den Arbeitstagen erweitert, zeigt sich ein ähnliches Verhalten wie bei der Luftfeuchtigkeit. Das Modell kann aufgrund des Indikator für Arbeitstage zwar die wöchentliche Saisonalität erfassen, die Luftfeuchtigkeit bring jedoch keine zusätzlichen Informationen.

Regression mit Arbeitstagen, Temperatur, Tagesstunden und Niederschlag

Der Niederschlag führt ähnlich wie die Luftfeuchtigkeit ebenfalls zu einer Verschlechterung, wenn es den aussagekräftigen Merkmalen hinzugefügt wird.